桃 时 珊瑚 属 植物 的 叶绿体 基因 组 结构 特征 及 系统 发 育 分 析 
Fin, BAR, WH, BR 
(广州 中 医药 大 学 中 药学 院 ， 广 州 510006) 

摘 要 : 为 确定 桃 叶 珊 瑚 属 (Aucuba) 植物 叶绿体 基因 组 的 结构 组 成 及 其 序列 差异 ， 揭 示 其 
属 下 种 间 亲 缘 关 系 , 该 研究 对 桃 叶 珊 瑚 (4. chinensis). HFX CA. japonica var. variegata) 等 
6 种 桃 叶 珊 瑚 属 植 物 和 丝 继 花 属 植物 黄杨 时 丝 继 花 〈Garrya buxifolia) 进行 二 代 测 序 ， 利 用 生 

物 信 息 学 软件 对 其 叶绿体 基因 组 序列 进行 组 装 和 注释 , 并 进行 基本 特征 分 析 、 序 列 比较 
以 及 系统 发 育 分 析 。 结 果 表 明 : C) 桃 叶 珊瑚 属 植 物 叶 绿 体 基因 组 具 典 型 的 环 状 四 分 体 结 
构 ，6 条 序列 全 长 157 891-158 325 bp， 均 编码 114 个 基因 ， 包 括 80 个 和 蛋白 质 编码 基因 、30 个 
tRNA 基因 和 4 个 rRNA 基 因 ; (2) 6 种 植物 叶绿体 基因 组 高 频密 码 子 数 均 为 29 个 ， 偏 好 以 A/U 结 
， 确 定 了 这 6 条 序列 的 最 优 密码 子 共 100 个 ,包含 12 个 共有 的 最 优 密码 子 ;， (3) 6 条 叶绿体 基 
组 序列 共 检 测 到 270 条 散在 重复 序列 ，133 条 串联 重复 序列 以 及 412 个 SSR 位 点 ; (AD 比较 
因 组 学 分 析 结果 表明 ， 该 属 植物 叶绿体 基因 组 序列 高 度 保 守 ; 5) 从 叶绿体 基因 组 中 筛选 
10 个 高 变 片段 ， 〈6) 系统 发 育 分 析 结 果 文 持 桃 叶 珊 瑚 属 为 一 支持 率 高 的 单 系 ， 其 与 丝 继 花 
关系 较 近 ,该 研究 对 象 的 5 种 桃 叶 丙 瑚 属 植 物 以 及 1 种 丝 幼 花 属 植物 的 叶绿体 基因 组 均 为 首次 
测序 组 装 , 揭示 了 桃 叶 丙 瑚 属 及 其 属 下 种 间 的 系统 发 育 关系 , 为 桃 叶 珊瑚 属 植物 的 分 类 鉴定 和 
系统 发 育 提供 了 参考 资料 。 
关键 词 : 桃 叶 珊瑚 属 ， 叶 绿 体 基 因 组 ， 序 列 变 异 ， 重 复 序列 ， 密 码 子 偏好 性 ， 系 统 发 育 分 析 
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The sequence characteristics of chloroplast genomes and 


phylogenic analysis of genus Aucuba 
LI Juan, TONG Jiayun, FAN Zhichao, TONG Yi" 


(School of Pharmaceutical sciences, Guangzhou University of Chinese Medicine, Guangzhou 
510006, China) 
Abstract: To determine the genetic structure and sequence differences of the 
chloroplast genome of genus Aucuba and to reveal their interspecies relationship, the 
chloroplast genomes of six Aucuba species including A. chinensis and A. japonica var. 
variegata as well as Garrya buxifolia were sequenced using high-throughput 
sequencing technology. The chloroplast genomes were assembled and annotated using 
Bioinformatics software. The genome characteristics, sequence variation and 
phylogeny were analyzed based on the chloroplast genomes. The results were as 
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follows: (1) Six Aucuba plants chloroplast genomes exhibited typical quadripartite 
circular structure (i.e., LSC, SSC, IRB and IRA) and were between 157 891-158 325 
bp in length; (2) A total of 114 genes were annotated (except the duplicate genes on 
IRs), including 80 protein-coding genes (CDS), 30 tRNA genes and 4 rRNA genes; (3) 
270 interspersed repeats, 133 tandem repeats and 412 SSR loci were detected in the 
six Aucuba chloroplast genomes; (4) A total of 29 high-frequency codons prefer 
ending in A/U. 100 optimal codons were filtered out in total, 12 of which were shared 
by six Aucuba species; (5) Comparative analysis of six Aucuba species reveals a 
highly conserved chloroplast genome sequence; (6) Ten highly divergent regions were 
identified based on nucleotide diversity analysis; (7) The phylogenetic trees were 
constructed using maximum likelihood (ML) and Bayesian (BI) showing a similar 
topology. The results support that genus Aucuba was monophyletic, as a sister to 
genus Garrya. We first sequenced the complete chloroplast genomes of these five 
Aucuba species and one Garrya species. The results reveal the interspecies 
relationships and the taxonomic status of genus Aucuba, and provide genetic 
resources for the classification, identification and phylogeny of the genus Aucuba. 
Key words: Aucuba, chloroplast genome, sequence variation, repeated sequences, codon 
preference, phylogeny 

PKI HH (Aucuba Thunb.) , 隶属 于 丝 缕 伦 科 (Garryaceae) (Angiosperm Phylogeny 
Group et al, 2016) ， 为 常 绿 小 乔木 或 灌木 。 该 属 植 物 四 季 常 青 ， 冬 季 红 果 ， 为 庭园 绿化 的 
优良 观 叶 观 果树 种 (Xiang & Boufford, 2005) 。 本 属 部 分 种 类 民间 药 用 ， 主 要 以 根 、 叶 和 果 
实 入 药 ， 具 有 清热 解毒 、 祛 风 除 湿 、 活 血 化 瘀 等 功效 《国家 中 医药 管理 局 中 华 本 草编 委 会 
1997; 江 纪 武 ，2005; 艾 铁 民 ，2013; 南京 中 医药 大 学 ，2006) 。 最 先 从 桃 叶 珊 瑚 属 植物 中 
发 现 的 桃 叶 珊瑚 昔 〈Aucubin, AU) 具有 广泛 药理 活性 ， 包 括 抗 氧化 、 抗 衰老 、 抗 炎 、 保 肝 
等 (Zeng et al., 2020) 。 

然而 ,， 桃 叶 珊瑚 属 植物 基础 的 分 类 修订 和 物种 划分 远 未 完成 , 这 直接 影响 今后 桃 叶 珊 天 
属 植 物 的 化 学 和 药理 研究 ， 也 给 药 用 桃 叶 珊瑚 新 资源 的 开发 、 推 广 、 生 产 指导 等 带 来 困难 
虽然 桃 叶 丙 瑚 属 的 花 、 果 实 或 全 株 体态 使 其 很 容易 与 其 他 类 群 区 别 , 但 由 于 可 用 作 桃 叶 "m 
EE PD Ah AS XE SUE RHUER AR SECA IB. MEER. BRS), 种 间 缺 乏 有 效 区 分 的 形态 
分 类 性 状 ， 且 可 能 存在 广泛 的 杂交 和 多 倍 化 事件 ， 导 致 属 内 物种 划分 存在 很 大 困难 ， 该 属 系 
统 而 全 面 的 种 间 系 统 发 育 关系 鹃 竺 建立 (Xiang & Boufford, 2005) 。 
在 植物 进化 过 程 中 ， 叶 绿 体 基 因 组 的 结构 和 序列 相对 保守 ， 编 码 基 因 的 数量 、 结 构 、 组 
成 和 排列 顺序 基本 一 致 ， 极 少 发 生 重组 等 变异 ， 被 广泛 应 用 于 植物 的 物种 鉴定 、 系 统 发 育 和 
物种 起 源 研究 中 《 刘 犯 和 黄 林 芳 ，2020) 。 目 前 ， 在 美国 国家 生物 信息 中 心 (NCBD 上 共 
收录 了 7 条 桃 叶 珊 瑚 属 植物 叶绿体 基因 组 序列 ， 黄 媛 基于 这 7 条 叶绿体 基因 组 的 68 个 蛋白 
质 编码 基因 对 桃 叶 珊瑚 属 进行 系统 发 育 分 析 , 结果 支持 了 丝 继 花 目 、 丝 继 花 科 和 桃 叶 珊瑚 属 
的 单 系 性 (Huang et al., 2022) . 

本 研究 通过 浅 层 基因 组 测序 技术 ， 以 已 发 表 的 青木 CA. japonica) 的 叶绿体 基因 组 ( 序 
列 号 NC_058874.1) 作为 参考 ， 组 装 注释 了 花 叶 青木 CA. japonica var. variegata) 、 峨 眉 桃 
叶 珊 瑚 CA. omeiensis) 、 桃 时 珊瑚 CA. chinensis) 、 密 花 桃 叶 珊 瑚 CA. confertiflora) 、 纤 尾 
PEI HHA CA. filicauda) . 72 DE! SHE CA. albopunctifolia var. angustula) 以 及 黄杨 时 丝 继 花 

(Garrya buxifolia) 的 叶绿体 基因 组 。 通 过 对 桃 叶 珊 瑚 属 植 物 的 叶绿体 基因 组 进行 序列 比较 

及 系统 发 育 分 析 ， 拟 探讨 以 下 问题 : CIO 6 种 桃 叶 珊瑚 属 植物 叶绿体 基因 组 序列 有 何 结构 
特征 ; (2) 这 些 序列 之 间 有 何 差异 ; G) 桃 叶 珊瑚 属 的 系统 发 育 地 位 如 何 ，6 种 桃 叶 珊 再 
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桃 叶 珊瑚 属 植物 的 分 子 材料 主要 来 源 ] 
体 采集 2~3 片 新 鲜 健康 叶片 ， 
袋 ， 用 硅胶 进行 快速 干燥 。 所 有 任 
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属 植物 之 间 有 着 怎样 的 亲缘 关系 。 以 期 为 今后 深入 下 
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珊瑚 属 植物 分 别 为 峨眉 桃 叶 珊 瑚 、 桃 叶 珊 瑚 、 


究 桃 叶 珊 期 属 植物 的 分 类 修订 、 系 统 发 
究 提 供 叶绿体 基因 组 信息 的 参考 资料 。 


F 西 南 和 华南 分 布地 野外 采集 的 新 鲜 叶 片 , 每 个 个 
湿 纸 巾 和 吸水 纸 擦 去 表面 的 污渍 和 水 ， 剪 碎 后 放 入 茶 包 
医药 大 学 标本 室 (GUCM) ， 经 该 


密 花 桃 叶 珊 


MS) CALI) 。 黄 杨 叶 丝 继 花 的 干燥 叶片 取 自 加 州 大 


学 伯克利 分 校 植物 园 (UC Botanical Garden) 栽培 植物 (分 子 标本 采集 号 SZ5417) 。 青 木 


的 叶绿体 全 基因 组 序列 (序列 号 NC_058874.1) 从 NCBI 数据 库 (https://www.ncbi.nlm.nih.gov/) 
下 载 , 用 作 叶 绿 体 基 因 组 组 装 及 注释 的 参考 ， 所 有 新 测序 的 叶绿体 基因 组 序列 以 及 注释 信息 
均 已 上 传 至 NCBI 数据 库 ， 并 获得 登录 号 。 采 集 信息 及 GenBank 登录 号 见 表 1。 
表 1 桃 叶 珊瑚 属 6 种 植物 采集 信息 及 GenBank 序列 号 
Table 1 Collected information and GenBank accession numbers of six Aucuba plants 
Genbank 序列 号 
植物 名 凭证 标本 采集 采集 地 点 GenBank 
Plant name Voucher specimen Collection location accession 
numbers 
Ue JL Er STU] 李 娟 LJ20210329026 四 川 峨眉 山 市 峨眉 山 00348516 
Aucuba omeiensis Li Juan LJ20210329026 Emei Mountain, Emei, Sichuan 
广东 惠州 市 象 头 山 
PEM SUE RD 李 玉 玲 LYL264 
Xiangtou Mountain, Huizhou, OQ348513 
A. chinensis Li Yuling LYL264 
Guangdong 
TA EBM IAE HR TY20081412 广西 那 坡 具 老 虎 跳 大 峡谷 00348514 
A. confertiflora Tong Yi TY20081412 Laohutiao Valley, Napo, Guangxi 
广西 桂林 市 桂林 植物 园 
花 叶 青木 HX TY20080506 
Guilin Botanical Garden, Guilin, 0Q348512 
A. japonica var. variegata Tong Yi TY20080506 
Guangxi 
广西 龙 胜 县 红 滩 瀑 布 
纤 尾 桃 叶 珊瑚 33 TY20080903 
Hongtan Waterfall, Longsheng, OQ348515 
A. filicauda Tong Yi TY20080903 
Guangxi 
FE EIER] 
李 娟 LJ20210329002 四 川 峨眉 山 市 峨眉 山 
A. albopunctifolia var. 0Q362998 
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图 1 6 种 桃 叶 珊 瑚 属 植物 图 
Fig.1 Pictures of six Aucuba plants 

2 方法 
2.1 总 基因 组 DNA 提取 与 测序 

采用 改良 的 CTAB 方法 (Doyle & Doyle, 1987) ， 从 硅胶 干燥 的 叶片 中 提取 桃 叶 珊 瑚 属 
植物 的 总 DNA。 提 取 总 DNA 后 ， 使 用 B-500 超 微量 分 光 光 度 计 (上海 元 析 仪 器 有 限 公 司 ) 
以 及 琼脂 糖 凝 胶 电泳 检测 所 提 DNA 的 质量 和 浓度 ， 检 测 合 格 的 DNA 测序 工作 委托 武汉 华 
大 基因 科技 有 限 公司 使 用 DNBSEQ 测序 平台 进行 二 代 测 序 。 最 终 每 个 样品 获得 3 GB 的 clean 
data. 
2.2 叶绿体 全 基因 组 的 组 装 、 注 释 以 及 物理 图 谱 的 绘制 

使 用 GetOrganelle-1.7.3.5. (Jin et al., 2020) 软件 进行 叶绿体 基因 组 拼接 组 装 ，k-mer fH 
设置 65、105、127， 线 程 t 设 置 24， 其 他 命令 使 用 默认 参数 ， 最 终 的 组 装 命令 为 
get organelle from reads.py -1 sample l.fastq.gz -2 sample 2.fastq.gz -F embplant pt -o 
output-plastome -R 10 -t 24 -k 65,105,127。 然 后 ， 以 青木 的 叶绿体 全 基因 组 序列 作为 参考 , 利 
用 PGA-master (Qu et al., 2019) 软件 对 组 装 出 的 叶绿体 基因 组 进行 注释 ， 使 用 Geneious R 
9.0.2( Basic, 2012 ) 软 件 对 PGA-master 的 注释 结果 进行 手动 校正 。 最 后 使 用 在 线 软件 OGDraw 

(Lohse et al., 2013 ) 绘制 叶绿体 基因 组 物理 图 谱 。 

2.3 叶绿体 基因 组 特征 分 析 

使 用 Geneious R 9.0.2 软件 分 别 统 计 6 种 桃 叶 珊瑚 属 叶绿体 全 基因 组 序列 、 两 个 单 拷贝 
区 以 及 一 对 反 向 重复 区 的 长 度 、 各 区 GC 含量 以 及 基因 注释 结果 等 信息 。 
2.4 密码 子 偏好 性 及 最 优 密码 子 分 析 

对 6 种 桃 叶 珊瑚 植物 叶绿体 基因 组 中 的 CDS 序列 进行 筛选 ， 剔 除 重复 基因 以 及 长 度 小 


于 300 bp 的 基因 , 序列 中 碱 基 类 型 仅 包 含 A、T、C、G, 每 条 序列 均 含 有 起 始 密码 子 (ATG ) 
和 终止 密码 子 (TAG, TGA 和 TAA) ， 序 列 中 间 没 有 终止 密码 子 。 最 终 每 个 叶绿体 基因 组 
序列 均 获 得 52 条 符合 条 件 的 CDS， 使 用 CodonW (Peden, 2005) 软件 计算 这 些 序 列 的 同 义 
密码 子 相对 使 用 度 (RSCU) 以 及 有 效 密 码 子 数 ENC) ， 所 得 数据 在 Excel 进行 整理 ， 并 
用 TBtools (Chen et al., 2020) 软件 绘制 热 图 。 密 码 子 中 RSCU 值 大 于 1 的 被 确定 为 高 频密 
码 子 (Wang et al., 2018) 。 同 时 满足 高 频 及 高 表达 条 件 的 密码 子 被 认定 为 最 优 密码 子 (Sharp 
& Li, 1987) 。 高 表达 基因 具有 较 低 的 ENC 值 ， 低 表达 基因 具有 较 高 的 ENC 值 ， 按 照 ENC 
值 的 大 小 对 每 个 物种 的 基因 进行 排序 ， 选 取 高 低 两 端 各 10% 的 基因 分 别 作为 低 表达 基因 组 
和 高 表达 基因 组 ， 计 算 高 表达 基因 组 和 低 表 达 基 因 组 每 个 密码 子 的 差 值 ARSCU，ARSCU 大 
于 0.08 则 定 为 高 表达 密码 子 ， 筛 选 出 高 达 表 密码 子 中 RSCU 值 大 于 1 的 高 频密 码 子 ， 即 得 
最 优 密码 子 (Sharp & Li, 1987) 。 
2.5 重复 序列 分 析 
通过 REPuter (Stefan et aL, 2001) 在 线 软件 查找 叶绿体 基因 组 的 重复 序列 ， 包 括 正 向 重 
复 序列 (Forward Repeats) 、 反 向 重复 序列 (Reverse Repeats) 、 互 补 重复 序列 (Complement 
Repeats) 以 及 回 文 序 列 〈Palindromic Repeats) 4 种 重复 类 型 ， 参 数 设 定 为 : 重复 碱 基 单 元 
n>30bp, 汉 明 距离 (Hamming distance) 为 3。 此 外 ,使 用 Tandem Repeats FinderCTRF (Benson, 
1999) 串联 重复 序列 查找 工具 的 默认 参数 检测 串联 重复 序列 (Tandem Repeats) 。 使 用 MISA 
(Beier, et al., 2017) 软件 的 Perl 脚本 检测 叶绿体 基因 组 的 SSR， 从 单 核 昔 酸 到 六 核 苷 酸 的 
© 重复 次 数 阔 值 设 定 依次 为 10、5、4、3、3。 即 1 个 碱 基 重 复 >10 次 、2 个 碱 基 重 复 >5 次 ，3 
个 碱 基 重 复 >4 YK, 4. 5. 6 个 碱 基 重 复 >3 次 。 
2.6 IR 边界 的 收缩 和 扩张 分 析 
使 用 在 线 软件 IRscope (Ali et al., 2018) 对 6 条 序列 进行 再 边界 收缩 和 扩张 的 可 视 化 
分 析 ， 得 到 叶绿体 基因 组 的 简化 示意 图 。 


= 2.7 序列 比较 分 析 

ft 以 哦 眉 桃 叶 珊 瑚 作为 参考 序列 ， 利 用 在 线 软件 mVISTA (Frazer et al., 2004) 对 6 个 时 
= 绿 体 基 因 组 进行 序列 一 致 性 比较 分 析 ， 采 用 Shuffle-LAGAN 运行 模式 ， 生 成 6 个 叶绿体 基 
PS 因 组 差异 的 可 视 化 结果 。 


2.8 叶绿体 基因 组 序列 共 线 性 分 析 
= 基因 数量 及 基因 顺序 的 保守 性 称 为 共 线 性 ， 使 用 Geneious R 9.0.2 软件 里 的 Mauve 插件 
€) (Darling et al., 2004) ， 对 6 条 序列 进行 共 线 性 分 析 ， 用 于 可 视 化 该 属 各 物种 基因 排列 顺序 
的 一 致 性 和 基因 重 排 与 倒 位 现象 。 
2.9 ECHTE E SEA PT 
使 用 DnaSP v6.0 (Rozas et al., 2017) 软件 对 6 条 序列 进行 滑动 窗口 分 析 ， 检 测 叶绿体 
基因 组 的 高 变 热点 区 及 其 大 小 , 变异 位 点 数 等 信息 , FETT A RS PELE (nucleotide diversity, 
PO 。 将 比 对 好 的 序列 导入 DnaSP v6.0， 运 行 参数 设 定 步 长 〈step size) 为 200 bp， 窗 口 长 
BE (window length) 为 600 bp, ixl PAF 0.01， 且 片段 长 度 不 小 于 150 bp 的 片段 作 
为 桃 叶 珊瑚 属 植物 叶绿体 基因 组 高 变 区 域 , 并 根据 基因 注释 的 结果 确定 它们 在 叶绿体 基因 组 
上 的 位 置 。 
2.10 系统 发 育 分 析 
为 了 揭示 桃 叶 丙 瑚 属 的 系统 发 育 关 系 ， 从 NCBI 下 载 了 丝 继 花 目下 的 杜仲 科 杜 仲 (序列 
号 NC_037948) ， 加 上 本 次 组 装 所 得 的 黄杨 叶 丝 继 花 (序列 号 OQ348517) ， 作 为 外 类 群 ， 
ki 9 条 叶绿体 基因 组 序列 构建 桃 叶 珊瑚 属 的 系统 发 育 树 。 使 用 Geneious R 9.0.2 里 的 
MAFFT (Rozewicki et al, 2019) 插件 进行 多 序列 比较 , 切 掉 序列 头 尾 不 一 样 长 的 碱 基 后 用 于 
系统 发 育 树 的 构建 。 通 过 最 大 似 然 法 (ML) FUE BD 重建 桃 叶 珊瑚 属 系统 发 


AKA. EH] IQtree (Minh et al., 2020) 构建 ML fl; 使 月 
进行 比 对 后 核酸 序列 替代 模型 的 选择 ， 以 贝 叶 斯 信息 准则 (Bayesian information criterion, 


H JModeltest (Posada, 2020) 软件 


BIC) 为 标准 选 出 最 佳 建树 模型 ， 使 用 MrBayes CRonquist & Huelsenbeck, 2003) 构建 BI 树 。 


3 结果 与 分 析 
3.1 桃 叶 珊 瑚 属 6 种 植物 叶绿体 基因 组 结构 和 基本 特征 


6 条 桃 叶 珊瑚 属 叶 绿 体 全 基因 组 的 物理 图 谱 见 图 2,6 条 序列 均 为 典型 的 双 链 环 状 DNA, 


分 子 序列 全 长 为 157 891~158 325 bp, 
87 210-87 563 bp, GC 含量 为 35.896-35.996, SSC 


其 总 GC 舍 量 为 37.7%~37.8%。LSC 区 的 序列 长 度 为 
区 的 序列 长 度 为 18 531 ~18 580 bp, GC 含 


量 为 31.5%~31.6%, IR 区 的 序列 长 度 为 26 067-26 143 bp, GC 含量 为 43.0%~43.1% C 2). 
白 编码 基因 (CDS) 、 


6 条 序列 均 编码 114 个 基因 AG IR 区 重复 的 基因 ) ， 
30 个 转运 RNA (tRNA) 、4 个 核糖 体 RNA (rRNA) 


桃 叶 珊瑚 
密 花 桃 叶 珊 瑚 


包括 80 个 蛋 
(#83) e 


Aucuba chinensis 157 891 bp 


A. confertiflora 157 954 bp 


P 峨眉 桃 叶 珊瑚 


A. omeiensis 158 113 bp 


FASE 


A, albopunctifolia var. angustula 158 144 bp 
花 叶 青木 


A. japonica var. variegata 158 237 bp 
桃 叶 珊瑚 


A, filicauda 158 325 bp 


光 和 系统 I Photosystem I 
光 和 系统 [I Photosystem II 
细胞 色素 复合 物 Cytochrome b/f complex 
ATP 合 成 酶 ATP synthase e 
NADH 脱 氢 酶 NADH dehydrogenase hj 
核 酮 糖 二 磷酸 羧 化 酶 大 亚 基 RubisCO large subunit N 
RNA RAB RNA polymerase 

核糖 体 蛋白 小 亚 基 Ribosomal proteins (SSU) 
核糖 体 蛋 白 大 亚 基 Ribosomal proteins (LSU) 
转运 RNAs Transfer RNAs 

核糖 体 RNAs Ribosomal RNAs 

clpPP、matK 基因 clpP, matK 

其 他 基因 Other genes 

假设 的 叶绿体 阅读 框 (ycf) Hypothetical chloroplast reading frames (ycf) 


HBEBNNECNSCESEN 


图 2 桃 叶 珊瑚 属 6 种 植物 叶绿体 基因 组 的 物理 图 谱 


Fig.2 Chloroplast genome map of six Aucuba plants 


表 2 桃 叶 珊 瑚 属 6 种 植物 叶绿体 基因 组 基本 特征 


Table 2 Chloroplast genomic characteristics of six Aucuba plants 


物种 BETH 密 花 桃 叶 珊 
EH H i 
Species 
Aucuba A. A. 


花 叶 青木 


A. japonica 


var. 


纤 尾 桃 
叶 珊瑚 
A. 


^F SEI HSH 
A. 
albopunctifolia 


omeiensis 


chinensis confertiflora variegata filicauda var. angustula 
EELK 
158 113 157 891 157 954 158 237 158 325 158 144 
Genome size (bp) 
大 单 找 贝 区 长 度 
87 281 87 210 87 269 87 505 87 563 87 386 
Length of LSC (bp) 
大 单 拷贝 区 GC 含量 
35.9 35.9 35.9 35.9 35.8 35.9 
GC content of LSC (96) 
小 单 拷贝 区 长 度 
18 546 18 547 18 531 18 544 18 580 18 552 
Length of SSC (bp) 
小 单 拷贝 区 GC 含量 
31.5 31.5 31.5 31.6 31.5 31.5 
GC content of SSC (%) 
反 向 重复 区 长 度 
26 143 26 067 26 077 26 094 26 091 26 103 
Length of IRs (bp) 
反 向 重复 区 GC 含量 
43.0 43.0 43.1 43.0 43.0 43.0 
GC content of IRs (%) 
总 GC 含量 
37.7 37.8 37.8 37.7 37:7 37.7 
Total GC content (%) 
总 基因 数 
114 114 114 114 114 114 
Total number of genes 
蛋白 编码 基因 数 
Number of 80 80 80 80 80 80 
protein-coding genes 
转运 RNA 基因 数 
30 30 30 30 30 30 
Number of tRNA genes 
核糖 体 RNA 基因 数 
4 4 4 4 4 4 
Number of rRNA genes 


RI 桃 叶 珊瑚 属 6 种 植物 叶绿体 基因 组 的 基因 组 成 


Table 3 Chloroplast genomes composition of six Aucuba plants 


基因 功能 基因 分 类 基因 名 称 
Gene function Gene category Name of gene 
核糖 体 蛋 白 大 亚 基 


Large Subunit of 


ribosome 


核糖 体 蛋 白 / 


Small subunit of 


小 亚 基 


Tibosome 


RNA 
自我 复制 


Self-replication 


聚合 酶 亚 基 
DNA-dependent RNA 


polymerase 


核糖 体 RNA 
Ribosomal RNA 


转运 RNA 
Transfer RNA 


rpl2>*x2, rpll4、 rpll6'. rp120、 rp122、 rpl23*x2, rpi32. 


rpl33. rpl36 


rps2、 rps3、 rps4, rps x2. rps8rps 11. rps12 x2, rpsl4. 


rpsl5. rpsl6'. rpsl8. rpsl9* 


rpoA、 rpoB、 rpoCl'. rpoC2 


rrn4.5°x2, rrn5°x2, rrnl6?x2. rrn23?x2 


trnA-UGC* x2, trnC-GCA, trnD-GUC. trnE-UUC, 


tmF-GAA、 trnfM-CAU. trnG-UCC'. trnG-UCC, 


trnH-GUG. trnI-CAU*x2, trnl-GAU**x2, trnK-UUU*, 


Photosynthesis 


其 他 基 医 
Other genes 


未 知 功能 基因 


Unknown function 


genes 


trnL-CAA*x2, trnL-UAA*, trnL-UAG, trnM-CAU, 
trnN-GUU?x2, trnP-GGG. trnQ-UUG, trnR-ACG?x2, 
trnR-UCU, trnS-GCU, trnS-GGA, trnS-UGA, trn T-GGU. 

trnT-UGU, trnV-GAC**2, trnV-UAC'. trnW-CCA, 


trnY-GUA 
光 系统 I 亚 基 
psaA、 psaB、 psaC. psal. psal 
Photosystem I 
光 系 统 I 亚 基 psbA, psbB. psbC、 psbD. psbE. psbF. psbH、 psbl. 
Photosystem II psbJ、 psbK、 psbL. psbM, psbN. psbT. psbZ、 ycf3™ 
NADH 脱氧 酶 亚 基 


ndhA'. ndhB*'x2. ndhC. ndhD. ndhE、 ndhF* 
ndhG、 ndhH. ndhi, ndhJ. ndhK 


Subunits of 
NADH-dehydrogenase 
细胞 色素 bf 复合 物 亚 基 
Subunits of cytochrome b/f 


petA、 petB'. petD*, petG、 petL. petN 
complex 
ATP 合成 酶 亚 基 
Subunits of ATP synthase 
核 酮 糖 二 磷酸 羧 化 酶 大 
亚 基 rbcL 
RubisCO large subunit 
翻译 起 始 因 子 


Translation initiation infA 


atpA. atpB« atpE« atpF'. atpH、 atpl 


factor 
Maturase 
EAN 
Protease 
被 膜 蛋 


Envelope membrane cemA 


matK 


clpP™* 


protein 
乙酰 CoA FR LIME 


Subunits of accD 


Acetyl-CoA-carboxylase 
细胞 色素 C 合成 酶 
C-type ccsA 


cytochromesynthesis 


IHI 


QUU 


ycfl. yof2?x2. ycfA. ycflS?x2 
Open reading frames 


EE: “表示 位 于 反 向 重复 区 的 基因 ;表示 反 式 剪接 基因 ;“ 表 示 含 有 一 个 内 含 子 的 基因 ;“ 表 示 含 有 两 个 内 


intron; 


含 子 的 基因 ; x2 RAW ZEA. 


Note: * indicates genes in inverted repeat regions; "indicates trans-splinting gene; "indicates genes containing one 


“indicates genes containing two introns; x2 indicates shows genes with duplicates. 


3.2 密码 子 使 用 偏好 


202307.00153v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


6 条 桃 叶 珊 瑚 属 叶绿体 基因 组 CDS 的 相对 同 义 密码 子 使 用 度 (RSCU ) 见 图 3。 RSCU 
1, 表明 该 密码 子 是 偏好 密码 子 , 使 用 较 频 繁 ,.RSCU 二 1 表明 该 密码 子 无 使 用 偏好 性 .RSCU 
<1 表明 该 密码 子 使 用 频率 较 低 。 在 分 析 时 剔除 终止 密码 子 UAA、UGA 和 UAG, UR fA 
酸 的 唯一 密码 子 UGG 和 和 蛋氨酸 的 唯一 密码 子 AUG， 因 为 这 些 密码 子 不 存在 偏好 性 。 结 
显示 : 6 条 序列 均 有 59 个 同 义 密码 子 ，RSCU>1 的 高 频密 码 子 数 均 为 29 个， 其中， 有 28 
个 以 A 或 口 结尾 ， 有 1 个 以 G 结尾 ， 说 明 桃 叶 珊 瑚 属 植物 叶绿体 基因 组 的 密码 子 偏好 以 A 
或 U 结尾 。 


==) 


JE BHT 30] 


Aucuba omeiensis 


AE DENTIS 


A. albopunctifolia var. angustula 


桃 叶 珊瑚 


A. chinensis 


纤 尾 桃 叶 珊瑚 
A. filicauda 


花 叶 青木 


A, japonica var. variegata 


密 花 桃 叶 珊 瑚 
A. confertiflora 


AUA 
UCC 


J pap em ep TM 
0.200.400.600.80 1.00 1.20 1.40 1.60 1.802.00 


颜色 越 深 表示 该 密码 子 的 RSCU 值 越 高 ， 高 频密 码 子 (RSCU>1) 已 用 红色 字体 标 出 。 
The darker color in the figure indicating the higher RSCU value of the codon; High-frequency codons (RSCU>1) 


marked in red. 
图 3 PEA 6 种 植物 叶绿体 基因 组 RSCU 热 图 
Fig.3 The RSCU heat map of chloroplast genomes of six Aucuba plants 

6 条 序列 共 筛 选 出 100 个 最 优 密码 子 〈 表 4) ， 其 中 ， 除 了 窄 斑 叶 珊瑚 、 花 叶 青 木 、 纤 
尾 桃 叶 珊瑚 和 密 花 桃 叶 珊 瑚 共同 拥有 的 UUG 以 G 结尾 之 外 ， 其 余 最 优 密码 子 缘 为 A/U £i 
尾 ，6 条 序列 共有 的 12 个 最 优 密码 子 ， 分 别 为 AAA、ACU、AGU、CAA、CCU、CGU、 
GAA、GCU、GGU、GUU、UCU、UGU。 其 中 ,峨眉 桃 叶 丙 瑚 、 花 叶 青 木 和 密 花 桃 叶 丙 珊 
分 别 特有 的 最 优 密 码 子 为 CAU、CUU fll GAU. 

表 4 桃 叶 珊瑚 属 6 种 植物 叶绿体 基因 组 最 优 密码 子 的 确定 


Table 4 Optimal codons in chloroplast genome of six Aucuba species 


窗 斑 叶 珊 瑚 
峨眉 桃 叶 珊 dnb AEAN 密 花 桃 叶 珊 
d ZY FEM 
物种 3] O ee pid 再 
albopunctifoli A. japonica fij] 
Species Aucuba A. chinensis A. 
a var. var. variegata A. filicauda 
omeiensis confertiflora 
angustula 


最 优 
密码 子 ARS RSC ARS RSC ARS RSC ARS RSC ARS RSC ARS RSC 
Optimal CU U CU U CU U CU U CU U CU U 


codons 


AAA 0.42 1.52 0.53 1.52 0.37 1.552 044 1.52 0.37 1.52 | 0.51 1.53 
ACU 0.71 1.59 | 0.63 1.60 0.73 159 076 1.61 0.89 1.60 0.65 1.59 
AGU 0.52 1.23 0.65 126 | 0.52 1.24 0.63 125 0.54 125 0.79 1.24 
AUU 0.14 1.44 0.75 1.44 x = 0.27 1.44 0.64 144 0.72 1.45 


CAA 0.27 1.54 0.27 1.54 0.23 1.54 0.31 1.54 0.12 1.55 0.23 1.54 
CAU 0.08 1.55 
CCU 0.93 1.55 0.74 1.57 0.98 1.55 0.95 1.56 0.92 1.56 0.67 1.55 


CGA 0.37 1.36 = = 0.43 1.36 0.51 1.36 
CGU 0.88 1.40 1.57 1.40 0.88 1.40 0.80 1.39 1.31 1.40 1.57 1.40 
CUU 0.13 1.25 
GAA 0.33 1.53 0.19 1.52 0.30 1.53 0.25 1.52 0.25 1.52 0.18 1.52 
GAU 0.14 1.61 


GCU 0.84 1.87 1.16 1.88 0.80 1.88 1.04 1.87 1.53 1.88 1.29 1.87 
GGU 0.81 1.30 1.51 1.30 0.80 1.30 0.73 1.30 1.29 1.30 1.32 1.30 


GUA 0.17 150 O51 149 0.28 1.49 — — 045 149 057 150 
GUU 0.70 147 081 148 O52 148 O91 149 047 149 072 147 
UAU 0.15 1.62 — — 014 162 022 1.63 
UCU 078 1.73 0.60 1.70 0.79 1.72 0.73 172 046 1.72 042 1.73 
UGU 0.53 151 091 149 050 4151 045 149 089 4149 0.77 151 
UUG 一 — 0.56 1.23 — — 012 123 042 124 0.666 123 
UUA 1.09 191 — — 1.15 191 077 191 
UUU 0.16 1.31 — — 018 131 
合计 
o 19 15 17 18 15 16 

VE: ARSCU= 高 表达 基因 RSCU- 低 表达 基因 RSCU, ARSCU 0.08 即 为 高 表达 密码 子 ，RSCU 为 桃 叶 丙 瑚 


> 


H 


MT ERASE CDS 的 相对 同 义 密码 子 使 用 度 ，RSCU>1 即 为 高 频密 码 子 。 
Note: The ARSCU is equal to the RSCU of high-expression genes minus that of low-expression genes. If the 


difference is greater than or equal to 0.08, the codon will be regarded as a highly expressed codon. The RSCU 
value is the relative synonymous codon usage of Aucuba species. If the value of RSCU is greater than 1, the codon 
will be regarded as a High-frequency codon. 
3.3 重复 序列 和 SSR 分 析 

利用 软件 REPuter 共 鉴 定 出 6 条 序列 共 270 个 散在 重复 序列 ,包括 133 个 正 向 重复 序列 、 
8 个 反 向 重复 序列 、2 个 互补 重复 序列 ，127 个 回 文 重复 序列 〈 见 表 5) 。6 条 序列 中 ， 正 向 
重复 序列 最 多 ， 回 文 重 复 序 列 次 之 ， 反 向 重复 序列 和 互补 重复 序列 较 少 存在 ， 仅 在 桃 叶 珊 珊 
和 和 罕 斑 叶 珊瑚 中 分 别 检测 到 了 一 条 互补 重复 序列 ， 其 他 4 种 均 未 检测 到 。 

#5 PLY STR 6 种 植物 叶绿体 基因 组 中 散在 重复 序列 的 类 型 和 数量 


Table 5 Types and number of interspersed repeats in the chloroplast genomes of six Aucuba plants 


散在 重复 序列 的 数量 
Number of interspersed repeats 
物种 正 向 重复 序 ” 反 向 重复 序 ”互补 重复 序 i 2 

回 文 重复 序列 

Species 列 列 列 合计 
Palindromic 
Forward Reverse Complement Total 
repeat 
repeat repeat repeat 
密 花 桃 叶 珊 瑚 
21 1 0 20 42 
Aucuba confertiflora 
花 叶 青木 
18 1 0 18 37 
A. japonica var. variegata 
£T Fé DEH 38] 24 2 0 22 48 


A. filicauda 


桃 叶 珊瑚 
21 2 1 20 44 
A. chinensis 
EXE 3138] 
20 1 1 20 42 
A. albopunctifolia var. angustula 
我 丑 桃 叶 丙 瑚 
29 1 0 27 57 
A. omeiensis 
通过 TRE 对 串联 重复 序列 进行 检测 ， 统 计 情 况 见 表 6. 6 条 序列 中 串联 重复 序列 共 133 


检测 到 串联 重复 序列 最 少 


组 


个 。 桃 叶 珊 瑚 属 植物 叶绿体 基因 


的 是 密 花 桃 叶 珊瑚 ， 为 20 个 ， 而 花 叶 青木 最 多 ， 达 25 
的 串联 重复 序列 在 LSC 区 和 IR 区 的 分 布 


明显 多 于 SSC 


Ro 桃 叶 珊瑚 属 6 种 植物 叶绿体 基因 组 中 串联 重复 序列 统计 


Table 6 Total counts of tandem repeats in the chloroplast genomes of six Aucuba species 


不 同 区 域 串联 重复 序列 的 数量 
物种 Number of tandem repeats in different regions 
Species 大 单 拷贝 区 ” 反 向 重复 区 B 小 单 拷贝 区 ” 反 向 重复 区 A Fit 
LSC IRB SSC IRA Total 
密 花 桃 叶 丙 瑚 
Aucuba confertiflora 4 5 5 6 20 
花 叶 青木 
A. japonica var. variegata 11 5 3 6 25 
en SA 
A. filicauda 6 7 4 7 24 
PEM SL 
A. chinensis 5 5 2 6 21 
E PEH 8] 
A. albopunctifolia var. angustula 7 6 3 6 22 
URE p E 
A. omeiensis 4 6 5 6 21 
MISA 软件 检测 结果 显示 ，6 条 序列 共 检 测 到 412 个 SSR 位 点 ， 共 识别 出 4 种 SSR, € 


FRIZER SSR (3677S) ~” ZEER SSR (267%) ~ ZË SSR (9^0 . WR 


SSRCIO 4S); SSR 的 类 型 以 单 


HIB A/T 重复 为 主 ， 


其 中 ， 纤 尾 桃 叶 珊瑚 和 花 叶 青 木 被 识 


最 少 的 SSR 个 数 ， 为 61 个 


(#7) 。 


占 比 所 有 SSR 位 点 数 的 86.88%~99.41%, 


别 出 最 多 的 SSR 个 数 ， 均 为 73 个 ; 桃 叶 珊 瑚 被 识别 出 


表 7 桃 叶 珊 瑚 属 6 种 植物 叶绿体 基因 组 SSR 在 不 同 区 域 数量 分 布 


Table 7 Number and distribution of SSR in the chloroplast genomes of six Aucuba species 


SSR 类 型 及 数量 
Type and number of SSR 

分 布 区 域 

物种 Med. AT T TA TT C T 合计 
Distribution of A T C 
Species TT A T C A A Tota 
SSR 

A T 

BEEK EU 大 单 拷贝 区 24 22 0 0 2 0 2 | 1 1 0 53 
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Aucuba 


confertiflora 


花 叶 青木 
A. japonica var. 


variegata 


纤 尾 桃 叶 丙 天 
A. filicauda 


PEM SUE RD 


A. chinensis 


^F EISE TUI 
A. 
albopunctifolia 


var. angustula 


dj JE Er SET] 


A. omeiensis 


LSC 
反 向 重复 
IRB 


小 单 拷贝 区 


SSC 
反 向 重复 
IRA 


cs 
P 
Im 
jm 

污 
x! 


a 
P 
Im 
[und 

污 

x! 


[X B 


[X A 


25 


26 


22 


24 


24 


23 


25 


22 


26 


23 


0 0 3 
0 0 7 
0 0 3 
1 1 55 
0 0 4 
0 0 10 
0 0 4 
1 1 57 
0 0 3 
0 0 10 
0 0 3 
1 0 50 
0 0 2 
0 0 7 
0 0 2 
1 1 56 
0 0 3 
0 0 9 
0 0 3 
1 0 55 
0 0 3 
0 0 7 
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SSC 
反 向 重复 区 A 
2 0 1 0 0 0 0 0 0 0 0 3 
IRA 
合计 Total 178 181 5 3 18 1 8 3 6 6 3 412 
3.4 IR/SC 边界 的 扩张 与 收缩 分 析 


桃 叶 丙 瑚 属 植物 叶绿体 全 基因 组 的 2 个 IR 区 在 LSC 及 SSC 之 间 存 在 LSC/IRB、IRB/SSC、 
SSC/IRA 以 及 IRA/LSC4 这 4 个 边界 (图 4) 。4 个 边界 相对 保守 ， 但 各 种 之 间 仍 具 较 小 差 
JE, LSC/IRB 的 边界 均 位 于 rps19 基因 内 部 ,6 条 序列 的 rps19 基因 均 向 IRB 区 扩张 了 33 bp; 
SSC/IRB 边界 均 位 于 ndhF 基因 内 部 ,6 条 序列 的 ndhF 基因 均 向 耻 B 区 扩张 了 42 bp; SSC/IRA 
边界 均 位 于 ycfl 基因 内 部 , 密 花 桃 叶 珊瑚 和 花 叶 青木 的 ycfl 基因 向 IRA 区 扩张 了 1 082 bp, 
纤 尾 桃 叶 珊 瑚 、 罕 斑 叶 珊瑚 和 哦 眉 桃 叶 珊 瑚 的 ycfl 基因 向 IRA 区 扩张 了 1079bp， 桃 叶 珊 
瑚 的 ycfl 基因 向 IRA 区 扩张 了 1061 bp; LSC/IRA 边界 位 于 trnH BRIE, UE per 339] 5 25 
花 桃 叶 丙 瑚 的 LSC/IRA 边界 与 trnH 的 距离 为 14 bp, 其 余 4 种 的 LSC/IRA 边界 与 trnH 的 距 
离 均 为 7 bp. 


LIT 


JLB JSB JSA JLA 
T 246 bp | 33 bj 42b 2217by 4 609 by 1 082 bj 
AE BRI SS cm ier Emm EEUU MA uM" 
Aucuba confertiflora p EE, 26077 bp BS IRa 
157 954 bp 
> 246 bp | 33 bp 42b] 2217bp 4594 bp 1082 bp 7bp H 
化 叶 青木 amma i m TT LES z i 
A. japonica var. variegata 
158 237 bp 
246 bp, 33 by 42 by 2217 b 4594 bp 1082 bp 7b 
纤 尾 桃 叶 珊 到 EI m n moo "a 
A. filicauda 
158 325 bp 


246 bp | 33 by 42 by 2217bj 4 609 by 1 082 by 
P P P P p p 


BEMI Tbp N | tent 
A. chinensis [ER [oce n. "4 


157 891 bp 
a m 246 bp |33 bp 名 2217bp 4594 bp 1082 bp 7bp "p 
P v, pea ER mpm — 
158 44 bp 4 609 bj 14 bj 
上 峨眉 JK M 246 bp | 33 bp 42bp 2217 bp p 1082 bp P, |en 
A. omeiensis 
157 891 bp 


图 4 桃 叶 珊瑚 属 6 种 植物 叶绿体 基因 组 LSC、IR 和 SSC 边界 比较 示意 图 
Fig.4 Comparison of the LSC, IR and SSC boundaries in the chloroplast genomes of six Aucuba 
plants 

3.5 序列 变异 分 析 

为 了 比较 桃 叶 珊瑚 属 内 物种 间 叶 绿 体 基因 组 序列 的 差异 , 以 峨眉 桃 叶 珊瑚 的 叶绿体 基因 
组 序列 为 参考 , 将 该 6 条 序列 进行 全 局 对 比 , mVISTA 图 的 结果 显示 了 桃 叶 珊瑚 属 6 条 序列 
的 高 度 相 似 性 ， 单 拷贝 区 比 反 向 重复 区 更 保守 ， 编 码 区 比 非 编码 区 Cnon-coding sequences, 
NCS) 相对 更 保守 (图 5) 。 位 于 LSC 区 的 trnC-GCA- petN 以 及 位 于 下 区 的 rps7- trnV-GAC 
均 为 基因 间隔 区 , 在 这 些 区 域 相似 度 较 低 , 存在 不 同 程度 的 变异 。 此 外 , rRNA 基因 和 tRNA 
基因 区 域 的 一 致 度 最 高 ， 序 列 最 为 保守 。LSC 和 SSC 区 序列 相 比 于 IR 区 有 更 多 的 变异 ， 表 
明 IR 区 在 进化 过 程 中 更 为 保守 。 
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箭头 表示 基因 的 方向 ， 深 蓝 色 区 域 表 示 编 码 区 ; 红色 区 域 表 示 非 编码 序列 ， 浅 蓝 色 区 域 表 示 tRNA EX 


灰色 


从 50% 到 100% 序 


示 


Y ftc 
Gray arrows and thick black lines indicates gene orientation; Dark blue indicates exons; Red regions indicates 


rRNA; 


non-coding Sequences; Light-blue indicates tRNA or rRNA; Y axis indicates the similarity among sequences, 


ranging from 50% to 100%. 


图 5 桃 叶 珊瑚 属 6 种 植物 叶绿体 基因 组 序列 可 视 化 比 对 分 析 


Fig.5 Plastomes comparison of six Aucuba species 
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3.6 叶绿体 基因 组 共 线 性 分 析 

叶绿体 基因 组 的 多 重 基 因 组 比 对 法 检测 出 6 条 序列 之 间 只 有 一 个 局 部 共 线 区 (locally 
collinear blocks, LCBs) (图 6) ， 所 有 基因 的 种 类 、 数 量 和 排列 顺序 在 属 内 均 高 度 一 致 ， 叶 
绿 体 基因 组 完全 共 线 , 没有 重 排 重组 现象 发 生 , 进一步 说 明 该 属 叶绿体 基因 组 具有 较 高 的 保 
守 性 。 
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图 6 桃 叶 珊 瑚 属 6 种 植物 叶绿体 全 基因 组 Mauve 共 线 性 分 析 
Fig.6 Mauve genome alignments of the whole chloroplast genomes of the six Aucuba plants 

3.7 ee 

滑 窗 分 析 结 果 显示 , 6 ARP IAA FS FEE CP 0~0.018 89 之 间 , “FLY Pi (8.73 0.003 
51 (图 7) , ， 表 明 6 种 植物 的 叶绿体 基因 组 高 度 相 似 ， 序 列 非 常 保守 ; 其 IR KERE 
样 性 (P=0.000 85) 明显 低 于 LSC 区 (P=0.004 47) 和 SSC (P=0.006 14) X, SSC 显示 出 
最 高 的 核 音 酸 多 样 性 ,而 IR. 区 在 整个 叶绿体 基因 组 中 更 为 保守 。 共 筛选 出 10 个 高 变 片 段 ( 表 
8), 包括 位 于 LSC XA rps16.rps16-trnQ-UUG .rpoB-trnC-GCA eee ps 
psbM-trnD-GUC 和 accD-psal 七 个 片 ， 以 及 位 于 SSC 区 的 ndhE、ndhE-ndhG 和 ycfl 三 个 
片段 ， 其 中 ，yefl 的 分 化 程度 最 高 。 在 这 些 高 变 区 域 中 ， 仅 有 rps16、ndhE 和 yefl Sate 
是 编码 序列 ， 其 他 高 变 片段 均 位 了 m 间隔 区 Cintergenic spacer, IGS) ， 这 些 高 变 片 段 可 
作为 桃 叶 丙 瑚 属 植物 物种 鉴定 的 条 形 码 候选 片段 。 
目前 ， 叶 绿 体 基因 组 中 被 广泛 应 用 于 植物 鉴定 的 3 条 通用 的 条 形 码 为 matK«. rbcL 和 
trnH-GUG-psbA, 但 是 在 本 研究 中 ,这 3 个 片段 在 桃 叶 珊瑚 属 叶绿体 基因 组 序列 中 均 显 示 了 
较 低 的 Pi 值 ， 变 异 程度 不 理想 ， 从 Pi; 值 的 角度 分 析 不 适合 做 分 子 标记 。 
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窗口 中 点 的 位 置 ”Position of midpoint in a window 


窗口 长 度 600 bp, 474K 200 bp. 10 个 高 变 区 (高 Pi 值 ) 均 被 标记 。 
Window lengths is 600 bp; step size is 200 bp. Ten regions with the highest Pi values are marked out. 


图 7 基于 滑 窗 分 析 检 测 桃 叶 珊 瑚 属 植物 叶绿体 全 基因 组 的 高 变 区 


Fig.7 Hypervariable regions within the chloroplast genomes of six Aucuba species using a sliding 


window analysis 
表 8 桃 叶 珊瑚 属 6 种 植物 叶绿体 基因 组 10 个 高 变 区 信息 


Table 8 Ten hypervariable regions of chloroplast genomes of six Aucuba plants 


序号 片段 片段 长 度 核 昔 酸 多 态 性 分 布 区 域 
Number Fragment Fragment size (bp) Pi Distribution region 
1 rps\6 1 132~1 139 0.017 22 LSC 
2 rps 16-trnQ-UUG 1 739~1 794 0.012 22 LSC 
3 rpoB-trnC-GCA 1 251-1 267 0.011 78 LSC 
4 petN-psbM 1 15251 172 0.014 78 LSC 
5 trnC-GCA-petN 700~830 0.011 33 SSC 
6 psbM-trnD-GUC 1 172-1 192 0.010 33 LSC 
7 accD-psal 685—704 0.012 56 LSC 
8 ndhE 306 0.016 67 SSC 
9 ndhE-ndhG 227 0.010 78 SSC 
10 ycfl 5 670~5 691 0.018 89 SSC 


3.8 系统 发 育 分 析 

根据 BIC 方法 用 JModeltest fii Hy AAT AR AY oc ES AN GTR+G 。 分 别 使 用 软件 
MrBayes 和 IQtree 构建 BI 树 和 ML 树 ， 结 果 见 图 8。 系 统 发 育 分 析 结 果 表 明 ， 基 于 叶绿体 
全 基因 组 构建 的 BI 树 和 ML 树 展现 出 了 完全 一 致 的 拓扑 结构 ， 桃 叶 珊 瑚 属 所 有 物种 形成 一 
个 支持 率 高 的 单 系 (BS=100%, pp=1) ， 与 丝 继 花 属 构成 姊妹 类 群 ， 共 同 组 成 丝 继 花 科 。 桃 
叶 丙 瑚 属 属 内 分 化 为 两 个 进化 文 , 峨眉 桃 叶 珊 瑚 、 密 花 桃 叶 珊瑚 以 及 桃 叶 珊 瑚 共同 组 成 进化 
MI (Clade I, BS=100%, pp=1) ; 花 叶 青木 、 青 木 、 纤 尾 桃 叶 珊 瑚 以 及 罕 斑 叶 珊 瑚 共同 组 成 
进化 支 I (Clade II, BS=100%, pp=1) 。 


100/1.00 


人 花 叶 青木 Aucuba japonica var. variegata 


AK A. japonica 
纤 尾 桃 叶 珊瑚 A. filicauda 


2 XII 
Clade II 


E 、 
AS SEI SW] A. albopunctifolia var. angustula = E ut 8 
峨眉 桃 叶 珊 瑚 A. omeiensis Š E E E 
100/1.00 密 花 桃 叶 珊 瑚 A. confertiflora B i us 
桃 叶 珊 瑚 A. chinensis pre 


黄杨 叶 缘 绢 花 Garrya buxifolia 


杜仲 Eucommia ulmoides |* 


外 类 群 
Outgroup 


分 支 上 的 数字 分 别 为 自 展 支 持 率 和 贝 叶 斯 后 验 概率 。 
Numbers above the branches are the bootstrap values and Bayesian posterior probabilities. 


图 8 EP REA 9 条 叶绿体 全 基因 组 构建 的 系统 发 育 树 (ML 和 BID 


Fig.8 Phylogenetic relationships inferred from maximum likelihood and Bayesian inference based 


on nine Garryales chloroplast genome datasets (ML and BI) 
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4 讨论 与 结论 


4.1 叶绿体 基因 组 的 结构 特征 

该 研究 组 装 注释 了 桃 叶 珊 瑚 属 6 种 植物 的 叶绿体 基因 组 , 并 进行 了 序列 比较 分 析 , 结果 
显示 6 条 序列 是 高 度 相似 的 , 无 论 是 基因 组 结构 及 大 小 ,还 是 基因 的 含量 及 组 成 ， 皆 是 相对 
保守 的 。 桃 叶 丙 瑚 属 叶 绿 体 基因 组 拥有 典型 的 环 状 四 分 体 结构 ，6 条 序列 全 长 157 891-158 
325 bp, 6 条 序列 均 编 码 114 个 基因 ， 包 括 80 个 蛋白 质 编码 基因 、30 个 tRNA 基因 以 及 4 
个 rRNA 基因 , 总 GC EX 37.7%~37.8%. LSC, SSC, IR 区 的 GC 含量 分 别 为 35.8%~35.9%、 
31.5%~31.6%、43.0%~43.1%, 与 大 多 数 被 子 植物 一 样 ， 桃 叶 丙 瑚 属 叶 绿 体 基因 组 的 IR 区 相 
较 于 LSC 区 和 SSC 区 都 更 为 稳定 ， 有 着 最 高 的 GC 含量 。 

密码 子 对 于 遗传 信息 的 正确 表达 至 关 重 要 , 密码 子 的 使 用 偏好 在 不 同 物种 甚至 某 一 物种 
内 的 不 同 基因 都 具有 特异 性 , 这 是 由 于 基因 与 物种 长 期 进化 过 程 中 选择 、 突 变 以 及 漂 变 等 因 
素 的 综合 作用 , 亲缘 关系 越 近 或 者 生存 环境 越 相 似 的 物种 越 有 可 能 采用 相似 的 密码 子 选 择 策 
各 (Romero, et al., 2000; Xu, et al., 2011) ， 通 过 比较 密码 子 偏好 性 差异 可 以 推断 基因 是 否 受 
到 不 同 程度 的 翻译 选择 ， 对 于 探讨 桃 叶 珊 瑚 属 物种 的 进化 模式 有 着 重要 的 作用 。6 条 序列 均 
> 有 59 个 同 义 密码 子 , RSCU>1 的 高 频密 码 子 数 均 为 29 个 , 其 中 , 除了 UUG 以 G 结尾 之 外 ， 
ER 28 个 高 频密 码 子 均 以 A/U 结尾 ， 这 表明 桃 叶 珊瑚 属 叶绿体 基因 组 的 密码 子 偏好 以 A/U 
结尾 ; 在 6 条 序列 中 共 筛 选 出 100 个 最 优 密码 子 , 包含 12 个 共有 最 优 密码 子 , 分 别 为 AAA、 
© ACU, AGU, CAA, CCU, CGU, GAA, GCU, GGU, GUU, UCU, UGU, 均 是 以 A/U 
结尾 , 尤其 是 以 U 结尾 , 这 与 双子 叶 植物 偏好 使 用 A/U 结尾 密码 子 的 研究 结果 一 致 (Kawabe 
& Miyashita, 2003) 。 

叶绿体 重复 序列 的 存在 和 丰富 程度 可 增加 生物 种 群 遗 传 多 样 性 , 且 与 多 种 系统 发 育 信号 
JX (Adeyemo et al., 2021) , SSR 和 重复 序列 在 叶绿体 基因 组 中 广泛 存在 ， 具 有 丰富 的 多 
态 性 位 点 ， 易 复制 、 遗 传 信息 含量 高 等 优点 ， 在 研究 物种 遗传 多 样 性 、 亲 缘 关 系 、 品 种 鉴定 
和 标记 辅助 育种 中 具有 较 高 的 可 靠 性 CAdeyemo etal., 2021; 贾 守 宁 等 ，2022) 。6 条 叶 绿 
体 基 因 组 序列 共 检 测 到 412 个 SSR 位 点 ，SSR 的 类 型 以 单 核 苷 酸 A/T 重复 为 主 ， 且 主要 位 
于 LSC 区 ; 6 条 序列 共 检 测 到 270 条 散在 重复 序列 以 及 133 条 串联 重复 序列 。 该 属 叶绿体 
基因 组 上 的 重复 序列 的 功能 还 需 进一步 的 深入 研究 。 
4.2 叶绿体 基因 组 的 结构 比较 分 析 

比较 基因 组 学 分 析 结 果 表 明 , 桃 叶 珊 瑚 属 叶绿体 基因 组 序列 具有 高 度 的 相似 性 PE DT 
区 比 反 向 重复 区 更 为 保守 ,编码 区 比 非 编码 区 更 为 保守 ; 叶绿体 基因 组 IR/SC 边界 分 布 的 基 
因 类 型 完全 相同 ; 基因 组 基因 结构 和 排列 顺序 整体 上 相似 ， 所 有 基因 的 种 类 、 数 量 和 排列 顺 
序 均 高 度 一 致 , 6 条 序列 完全 共 线 , 没有 重 排 重组 现象 发 生 ; 根据 课题 组 前 期 研究 (未 发 表 ) 
发 现 ， 目 前 通用 的 DNA 条 形 码 片段 (psbA-trnH，rbcL，matK，ITS，ITS2) 及 其 片段 组 合 
的 变异 程度 不 理想 , 对 桃 叶 丙 瑚 属 植 物 的 物种 分 状 率 不 高 , 不 适合 作为 该 属 植物 的 通用 条 形 
码 ， 该 文 从 桃 叶 珊 瑚 属 叶绿体 基因 组 LSC 区 和 SSC 区 共 筛 选 出 10 个 变异 率 较 高 ， 长 度 适 
中 的 高 变 片 段 , 这 些 高 变 区 可 作为 桃 叶 丙 瑚 属 物种 鉴定 的 潜在 条 形 码 ,可 以 进一步 结合 双亲 
遗传 的 核 基因 片段 联合 分 析 ， 为 桃 叶 珊瑚 属 植物 的 物种 鉴定 ， 杂 交 起 源 ， 多 倍 体 物 种 的 形成 
和 系统 进化 分 析 提 供 可 靠 的 分 子 标记 。 
43 系统 发 育 分 析 

系统 发 育 分 析 结 果 表 明 ， 桃 叶 珊 瑚 属 为 一 个 文 持 率 高 的 单 系 〈BS=100%, pp=1) ， 与 丝 
继 花 属 亲 缘 关 系 较 近 ， 共 同 构成 丝 继 花 科 ; 丝 继 花 科 与 杜仲 科 关 系 较 近 ， 这 与 APG IV 和 
Huang 等 (2022) 的 研究 结果 一 致 。 

桃 叶 珊 瑚 属 属 内 分 化 为 两 个 支持 率 高 的 进化 支 ,峨眉 桃 叶 珊 瑚 、 密 花 桃 叶 珊 瑚 以 及 桃 叶 
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珊瑚 共同 组 成 进化 支 T， 共 同 的 特征 为 乔木 、 花 绿色 ， 花 叶 青 木 、 青 木 、 纤 尾 桃 叶 珊 瑚 以 及 
窄 王 叶 丙 瑚 共同 组 成 进化 支 I， 共 同 的 特征 为 灌木 、 花 红色 。 这 两 组 特征 是 否 分 别 稳定 地 成 
为 两 个 进化 支 的 共 衍 征 ， 还 需 该 属 更 多 种 类 和 居 群 的 支持 。 在 进化 支 I[ 内 部 ， 花 叶 青 木 和 青 
RAM, 亲缘 关系 较 近 。 通 过 回 济 花 叶 青 木 与 青木 的 叶绿体 全 基因 组 序列 ， 发现 这 两 条 
叶绿体 基因 组 序列 , 无论 是 基因 数量 还 是 基因 位 置 ， 都 保持 高 度 一 致 ， 仅 在 基因 间隔 区 存在 
4 个 碱 基 位 点 的 变异 。 这 也 在 一 定 程度 上 印证 了 Ranney 的 观点 一 一 青木 中 表达 的 斑点 叶 性 
状 很 可 能 是 一 个 具有 多 重 等 位 基因 和 数量 遗传 的 核 基因 , 而 不 是 严格 的 母系 遗传 , 可 能 有 多 
个 具有 不 同 遗 传 模式 的 基因 可 以 产生 桃 叶 珊 瑚 属 植 物 带 斑 叶 的 性 状 (Ranney, 2018) 。 因此， 
“ 花 叶 ” 表 现 型 ， 在 桃 叶 珊 瑚 属 类 群 中 并 不 是 一 个 稳定 可 靠 的 性 状 ， 基 于 “ 花 叶 ”特征 建立 的 变 
种 或 新 种 划分 需 格 外 谨慎 。 
向 秋 云 在 FOC 中 将 峨眉 桃 叶 珊瑚 归并 入 原 变种 桃 叶 珊 瑚 (Xiang & Boufford, 20005)， 本 
研究 系统 发 育 分 析 结 果 表 明 哦 眉 桃 叶 珊瑚 与 密 花 桃 叶 珊瑚 关系 更 近 , 二 者 再 与 桃 叶 珊瑚 构成 
姐妹 群 。Ranney 使 用 流 式 细 胞 仪 对 桃 叶 珊瑚 属 植 物 的 相对 基因 组 大 小 进行 了 研究 ， 发 现 哦 
JADE SUSE 1Cx 值 (10.6 pg) 显著 高 于 包括 桃 叶 珊 瑚 〈7.37 pg) 在 内 的 其 他 种 类 (6.8~7.5 
pg) ， 这 表明 峨眉 桃 叶 珊 瑚 经 历 了 比 其 他 类 和 群 更 显著 的 倍 性 不 变 的 基因 组 扩张 〈 即 基因 组 扩 
张 非 染色 体 加 倍 引起 ) (Ranney et al., 2018); 结合 标本 与 野外 宏观 形态 性 状 分 析 ， 三 者 构成 
了 物种 关系 复杂 的 复合 种 群 。 因 此 ， 关 于 峨眉 桃 叶 丙 瑚 的 物种 划分 问题 ,还 需要 综合 更 多 形 
态 特征 ， 尤 其 是 细胞 学 证 据 ， 以 及 核 基因 数据 的 分 析 ， 特 别 是 共 线 性 单 拷贝 核 基因 ， 方 能 得 
到 较 清 楚 地 解析 。 此 外 ， 一 方面 ， 桃 叶 珊 瑚 属 植物 很 可 能 存在 广泛 的 杂交 和 多 倍 化 事件 ， 另 
一 方面 ,传统 用 以 种 间 鉴 别 的 叶 形 态 特征 在 本 属 中 变异 极 大 ， 导 致 该 属 植物 种 间 区 别 特征 存 
在 过 渡 变 异 和 交叉 类 型 ,缺乏 稳定 可 靠 的 区 别 特征 , 诸多 种 类 难以 准确 辨别 ,再 加 上 目前 我 
们 对 于 该 属 植物 形态 特征 仍 未 有 足够 的 把 握 , 因此 , 对 于 物种 鉴定 不 确切 和 物种 划分 明显 不 
合理 的 种 类 , 本 研究 未 予 吉 括 。 对 桃 叶 珊 瑚 属 植物 系统 全 面 的 属 下 分 类 系统 的 构建 和 属 下 种 
间 关 系 的 解决 有 赖 于 更 广泛 的 采样 ， 更 多 的 性 状 证 据 〈 尤 其 是 染色 体 数 据 ) ， 以 及 更 丰富 的 
有 具足 够 变异 位 点 的 单 拷贝 核 基因 和 叶绿体 基因 组 的 联合 分 析 来 建树 , 来 共同 厘清 桃 叶 珊 瑚 属 
的 属 下 分 类 问题 ， 为 以 后 深入 研究 桃 叶 珊 瑚 属 植物 的 药 用 和 园艺 用 途 等 商定 分 类 学 基础 。 
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